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Abstract Of DEI 971 0252 

The processing system 11 has a number of parallel processors 12. Instruction routine execution data is 
collected 13 and used to generate a processing profile in the form of a series of reports. This allows the 
various routines to be classified. The execution time data is summed 14 and a statistical evaluation made. 
A graphical representation is made that shows maximum, minimum, average and standard variation of the 
execution times of the routines. 
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Prufungsantrag gem. § 44 PatG ist gestellt 

@ Verfahren zur sichtbaren Darstellung von Ergebnissen der Leistungsuberwachung und -Analyse in einem 
Parallelrechnersystem 

Es wird ein Verfahren dor sichtbaren Darstellung von 
Ergebnissen der Leistungsuberwachung und -analyse fur ein 
Paralleirechnersystem beschrieben, bei dem eine Vieizahl 
von Prozessoren ein parallel verarbeitendes Programm aus- 
Tuhren, welches au$ einer Vielzahl von Routinen rusammen- 
gesetzt ist. Zuerst werden Informationen hinsichtlich der 
Ausfuhrungszeit von jeder Routine in einer Realzeitweise 
gesammelt, wahrend das Programm gleichlaufend durch die 
Vielzahl von Prozessoren ausgefuhrt wird. Zweitens werden 
Maximal-, Mittei- und Minima I werte der Ausfuhrungszeit 
von ieder Routine berechnet. basierend auf den Information 
nen, die fur die Vielrahl der Prozessoren gesammelt wurden. 
Drittens werden die gesemmelten Informationen in Form 
eines Ausfuhrungsprofils zusammengefa&t oder summiert 
^ und werden in graphischer Form dargestellt, und zwar unter 
Verwendung von Balkengraphiken, Kreisgraphiken oder Ra- 
darkarten. Fur jede Prozedur oder Programmschieife klassifi- 
ziert das s/orliegende Verfahren die Prozentsatze der Anwen- 
der-Netto-Programmausfuhrung, Kommunikation, Synchro- 
nisation und anderer parallel Jaufender Zusatzaufgaben, upd 
zeigt auch deren Abweichungen an. Dieses Merkmal unter- 
stutzt den Anv/ender darin, das aktuelle Programmverhalten 
zu verstehen und das paraOel verarbeitende Programm 
abzustimmen. 
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Beschretbung 



HINTERGRUND DER ERFINDUNG 
1. Gebiet der Erfindung 

Die vorliegende Erfindung betrifft cin Vcrfahren zur sichtbaren DarstcUung von Ergebnissen der Lektungs- 
uberwachung und -analyse in cinem Parallelrechnersystem, welches eine Viebahl von Prozessoren verwendet, 
und betrifft spezieller ein Vcrfahren zur sichtbaren DarsteUung von Ergebnissen der Leistungsubcrwachung und 
-analyse in einer bedienungskomfortableren und umfassenden Wcise. Die vorliegende Erfindung betrifft auch 
ein computer-Iesbares Medium, welches mit emem Computerprogramm codiert ist. bei welchem das zuvor 
genannte Verfahren realisiert wird 

2. Beschreibung des verwandten Standes derTechnik 

Parallele Verarbeitungstechniken spielen cine entschcidende Rolle bei der Befriedigung von heutzuuge 
wachsenden Anforderungen nach Hochleistungsrechnersysteraea Ein Parallelrechnersystem fuhrt cine Anwen- 
dung aus, indem es cine Vielzahl von Prozessoren verwendet. die parallel laufen, wodurch ein hoher Verarbei- 
tungsdurchgang erzielt wird Die Entwickiung von Software fOr ein Parallelrechnersystem bringt jedoch im 
aligeraeinen einige Schwierigkeiten bei der Programmaustestung, Bewertung und Leistungsabstimmung mit 
sich^undzwaraufgrundderenkomplexerNatur. 

Urn das Problem zu losen, werden Leistungsanalysierer als ein gunstiges Werkzeug cingefOhrt, wetehcs die 
Sof tware-Programmierer darin unterstutzt das Vcrhalten eines Parallelprogramms beim Tcsten zu uberwachen 
und dessen Leistung zu messea Der Analysierer verarbeitet die gesammelten Daten und prasentiert das 
ErgebnisdemAnwenderbFonncincsaufsummierten Ausfuhrungsproril& 

Ein herkoramlicher Leistungsanalysierer erzcugt ein AusfOhrungsprofil von einzelnen Prozessoren, welches m 
sokrher Weise aufsummiert ist, daS die gesamte Vcrarbeitungszcit in einige Kategorien klassifiziert ist, enthal- 
tend Netto-Betriebszeit und Lceriaufzeit usw. Das AusfOhrungsprofil jedes Prozessors wird getrennt in Form 
einer Balkengraphik Oder ahnlichem dargestellt 

Dieses herkoramliche Verfahren der DarsteUung von Ausfuhrungsprofilen ist jedoch fur Software-Entwick- 
lungsingenieure in ketner Weise vorteilhaft wenn das Parallelverarbeitungssystem hunderte yon Prozessoren 
enthalt Die an einera Analysicrer-Bildschirm dargesteUten Informationcn sind zu umfangreich, um das Pro- 
graramverhalten richtig verstehen zu konncn. da zu viele Prozessoren paraUel laufen. In einem solchen Fall kann 
der herkommliche Anaiysierer die Schwierigkeit dadurch etwas mildem, indem eine gewisse statistiscfae Verar- 
beitung hinsichtlich der gewonnen Rohdaten angewandt wird Dies erlaubt es. das Gesamtpro^ammvcrhalten 
Oder die mittlere Leistiing der Prozessoren den Ingenieuren in einer verstandlicheren Art darzubietea 

Jedoch sind die Informationcn, die durch diesen herkommlichen Leistungsanalysierer voigeschen werden, fur 
die Software-Entwicklungsingenieure nicht ausreichend, um die Systemqualitat bzw. Leistung voUst^ndig ver- 
stehen zu konnen und die dctaillierte Beaehung zwischen den Prozessen verstehen zu kdnnea <fie paraUel 
laufea 

ZUSAMMENFASSUNO DER ERHNDUNG 

Unter Einbeziehung des obcn gesagten, besteht eine erste Aufgabe der vorlicgendcn Erfindung darin, cin 
verbessertes Verfahren zur sichtbaren DarsteUung von Ergebnissen der Leistungsuberwadiung und -analyse in 
cinem Paralleh-echnersystem zu schaffen, welches ProzcntsStze der Anwcnder-Netto-Programmausftihrung, 
Kommunikation, Synchronisation und anderer parallel ablaufender Organisationsaufgaben zeigt als auch deren 
Abweichungen anzeigt 

Es ist ein weiteres Ziel der voriiegenden Erfindung, ein verbessertes Vcrfahren zur sfehtbaren DarsteUung von 
Ergebnissen der LeistungsQberwachung und -analyse in einem Paralleh-echnersystem zu schaffen, weldies dem 
Anwender die Mdglichkeit bietet, Software-Routinen in einem parallel vcrarbeitendcn Programm zu bewerten, 
and zwar uber eine problemlosc und vorteilhafte graphische Wiedergabe des Ausfuhrungsprofils. 

Um die genannte Aufgabe zu loscn, schafft die voriiegende Erfindung cin Verfahren zur sichtbaren Darstel- 
lung von Ergebnissen der LeistungsQberwachung und -analyse in einem ParaBcb^chnersiystem, bei dem erne 
Viebahl von Prozessoren ein paralleles Vcrarbcitungsprogramm ausfuhren, welches aus einer Vielzahl von 
Routinen zusammengesetzt ist Das Verfahren umf afit die folgenden Schritte: 

(a) Samracln von Informationen hinsichtlich der AusfOhrungszeit von jeder Routine, die gieichlaufend durch 
eine Vielzahl von Prozessoren ausgefuhrt wird unter BerQcksichtigung der Klassifizierung der Routinen; 

(b) Ableiten eines Maximalwertes, eines Mittelwcrtcs, eines Minimalwertes und einer Standardabweichung 
der Ausfuhrungszeit von jeder Routine basierend auf den Informarionen, die far die Vielzahl der Prozesso- 
ren gesammelt wurden; und 

(c) graphisches Darstellen der Ausfuhrungsprofil-lnformation, welche den Maximalwert, deh Miltelwert 
und den Minimaiwcrt und die Standardabweichungder AusfOhrungszeit jeder Routine enthalt 

Um spezieU das weitere ZicL welches oben erlauiert wurde, zu erreichen, wird ein Verfahren zur sichtbaren 
DarsteUung von Ergebnissen der LeistungsQberwachung und -analyse fur em Parallelrechnersystem geschaffen. 



GemaB dem Verfahren werdeo Ausfuhningsprofil-Infonnationen in Form von Balkengraphiken, Kreisgraphi- 
ken Oder Radarkarten dargestellt 

Weitere Ziele neben den obigen, MerkmaJe und VorteiJe der vorliegenden Erfindung ergebea sich aus der 
folgenden Beschreibung in Verbindung mit den beigefQgten Zeichnungen, die eine bevorzugte Ausfuhrungsfonn 
der vorliegenden Erfindung als Beispiel veranschaulictiea s 

KURZBESCHREIBUNG DER ZEICHNUNGEN 

Rg, I ist eine Konzeptdarstelliing eines Leistungsanalysierersysteras, welches ein Sichtdarstellungsverfahren 

gcmaB der vorliegenden Erfindung verwendet; to 
Fig. 2 ist ein FluBdiagraram, welches einen ProzeB der Modifiziening und Kompiliening cines Programms 

zeigt, welches fur em Parallelverarbeitungssystcm geschrieben wurde; 
Fig. 3 ist eine Tabelle, in der Laufzeit-Subroutinen aufsummiert sind, die fOr eine Leistungsuberwachung und 

-analyse vorgeschen werden; 
Fig. 4 ist ein FIuBdiagramm, welches die Funktionen der Laufeeit-Subroutine # 1 beschreibt; js 
Fig. 5 ist ein FluBdiagraram, welches die Funktionen der Laufzeit-Subroutine # 2 beschreibt 
Fig. 6 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 3 beschreibt 
Fig. 7 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine « 4 beschreibt 
Fig. 8 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine #5 beschreibt 
Fig. 9 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 6 beschreibt; 20 
Fig. 1 0 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine it 1 beschreibt 
Fig. i 1 ist ein FIuBdiagramm, welches die Funktionen der Laufzeit-Subroutine # 8 beschreibt 
Fig. 12 ist eine Tabelle, in der die Informadonen aufsummien sind, die durch das Leistungsanalysierersystem 

der vorliegenden Erfindung zu sammein sind; 
Fig. 13 ist ein Diagramm, welches ein erstes Beispiel einer Ausfuhrungsprofilanzeige geroaB der vorliegenden 25 

Erfindung zeigt, bei der jede Prozedur oder Schleif e skaliert ist in bezug auf die Ausfuhrungszeit emes gesamten 

Programms; 

Fig. 14 ist ein Diagramm, welches ein zweites Beispiel der Ausfuhrungsprofildarstellung zeigt bei der aile 
Prozeduren und Schleif en in gleicher Weise skaliert sind, ungeachtet deren absoluter Ausfuhnmgszeiten; 

Fig- 15 ist ein Diagranmi, welches ein drittes Beispiel einer Ausfflhrungsprofildarstellung zeigt, in der das 30 
Ausf uhrungsprofil von jeder Prozedur oder Schleife in einer Krcisgraphik wiedergegeben ist; 

Fig. 16 ist ein Diagramm, welches ein viertes Beispiel der Ausfuhrungspronidarstellung zeigt, in der das 
AusfuhrungsprofiJ in einer Radarkarte wiedergegeben ist; 

Fig. 17 ist ein Diagramm, welches ein funftes Beispiel einer Ausfuhrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt; und 35 

Fig. 18 ist ein Diagramm, welches ein sechstes Beispiel der Ausfuhrungsprofildarstellung gemaB der vorlie- 
genden Erfindung zeigt 



BESCHREIBUNG DER BEVORZUGTEN AUSFOHRUNGSFORM 
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Eine Ausfuhrungsfonn der vorliegenden Erfindung soil nun im folgenden unter Hinweis auf die beigefugten 
Zeichnungen beschrieben werdea 

Fig. 1 ist eine Konzeptdarstellung cines Leistimgsanalysierersystems, in welchem ein Sichtbardantellverfafa- 
ren gemaB der vorliegenden Erfindung angewandt wird. Ein Paralleh-echnersystem 1 1 ist durch eine Vielzahl von 
Prozessoren t2a— 12n aufgebaut die als Berechnungselemente dienen und die zusammeo laufen, um umfangrei- 45 
che Berechnungsaufgaben zu erzielen, die in einem Parallelverarbeitungsprogramm codiert sind. Sokrhe Prozes- 
soren 12a— 12n umfassen einzeln Datensamraeleinrichtungen 13a— 13n und eine Datensummiereinrichtung 
14a— 14n zura Korrigieren und Aufsummieren von jeweils Ausfflhrungszeitdaten. 

Die Datensanuneleinrichtungen 13a— 13n sammein in einer Real zeitweise die Ausfuhrungszeitdaten wahrend 
der ProgrammausfOhrung in den jeweiligen Prozessoren 12a— I2n, in denen sie auftreten. Die Ausfuhrungszeit- so 
datcn, die durch die Datensamraeleinrichtungen 13a— 13n gesaramelt wiuiien, werden als Quellendaten fOr die 
AusfOhrungsprofile verwendet Die Ausfuhnmgsprofile bestehen aus einem Satz von Reports, welche die 
Anwender mit Informationen iiber die Prozessoren 12a— 12n, daB diese tatsdchlich arbeiten, versehen, wodurch 
diese das Programm von verschiedenen Gesichtspunkten aus bewerten konnen. 

Die Ausfuhrungsprofile weisen auf einige bestiramte Programmroutinen hin, welche das Parailelverarbei- 55 
tungsprogramm bilden, wie beispielsweise Prozeduren, Schleifen, eine parallele Verarbeitungsbibliothek, die 
durch das LeistimgsanaJysierersystem iiberwacfat und analysiert werden. In diesem Sinn werden diese Routinen 
als Subjekte der Profilbildung oder Profilsubjekte bezeichnet 

Die Datensummiereinrichtungen 14a— 14n summieren die Ausfuhrungszeitdaten, die durch die Datensamrael- 
einrichtungen 13a- 13n gesaramelt wurdea Spezifisch gesagt, berechnen sie Maximal-, Mittel-, MinimaJwerte 60 
und eine Standardabweichung der gesammelten Ausfulmingszeiten fOr jede Routine oder jedes Subjekt fflr die 
Profilbildung. Um diese Aufgabe zu erreichen, ist es erforderiich, alle Ausfuhrungszeitdaten zu kompilieren, die 
durch die Datensamraeleinrichtungen 13a- 13n an einer einzelnen Stelle gesaramelt wurdea Daher befaBt sich 
eine der Datensummiereinrichtungen. wie beispielsweise 14^ mit den Summterungsaufgaben und andere 
I4b — 14n senden einf ach ihre Daten zu dieser Datensumraier-Subroutine 14a unter Verwendung von Inter-Pro- 6s 
zessor-Komraunikationspfaden (nicht gezeigt) in dem Parallelrechnersystem 1 1. 

In Wirklichkeit sind die oben bcschriebenen Datensamraeleinrichtungen 13a— 13n und die Datensummierein- 
richtungen 14a— 14n in dem Parallelrechnersystem 11 in Form eines Satzes von Subroutinen implenientiert, die 



als cin Teil der Laufzeitbibliothek fur die Parallelverarbeitung vorgesehen sind. Bei der vorliegenden Ausfuh- 
rungsform stehen acht Laufaeit-Subroutinen fQr diesen Zweck zur Verfugiin& wic in Fig. 3 aufgetistet ist Die 
detaillierten Funktionen der Datcnsammeleinricbtungen 13a- 13n und der Datensummiercinnchtungen 
14a— 14n soUen getrennt unter Hinwets auf die Fig. 4 bis 1 1 beschrieben werden. 

Um emeut auf Fig. I einzugehen, ist das Parallelrechnersystera 11 an zwei Datcndateien gekoppelt: eine 
Qaellencodedatei 15 und eine Profilinformationsdatei 16. Die Quellencodedatei 15 enihaJt den originalen Quel- 
lencode eines Programms, welches durch die Prozessoren 12a— 12n ausgefOhrt werden solL Die Profilinforma- 
tionsdatei 16 speichert AusfQhrungszeitdaten und dcren Summendaten, wic sie von den Prozessoren 12a— 12n 
bendtigt werdea 

Ein Profaanzeigeprozessor 17 analysiert die Inhalte der Profilinfonnationsdatei 16 und stcllt das Ergcbnis 
dieser Analyse in einera Ausfuhrungsprofilfenster 22 auf eincm Bildschirm einer Anzeigeeinhcit 21 dar. Hler 
macht der Profilanzeigeprozessor 17 das Ergcbnis der Analyse sichtbar, und zwar unter Verwendung raehrerer 
graphischer Wiedergabetechniken, wie dies an spaterer Stelle in Verbindung mit den Fig. 13 bis 18 bescfanebcn 
werden solL Eine Eingabevorrichtung IS wird dazu verwendet, um einige Bef ehle oder Daten in den Profilanzei- 
geprozessor 17 einzugeben. , 

Bei Verwendung dieser Eingabevonichtung 18 kann der Anwcnder dieses Leistungsanaiysicrersystems emen 
spezifischen Punkt (z. B. eine Prozedur oder Schleifc) bezeidmen. der in dem Ausfuhrungsprofilfenster 22 
dargestellt wird Em Quellencode-Positionsanalysiercr 19 sucht nach dem Quellencode, um die Codeposition 
(oder Zeilenzahl) entsprechend dem Punkt herauszufinden, der durch den Anwendcr bezeichnet worden ist 
GemaG der Codeposition-lnformation, die durch den Quellcncode-Positionsanalysicrer 19 geliefert wird, extra- 
hiert einen Quellencode-Browser 20 den rclevanten Teil des Quellencodes 15 und zeigt den extrahierten 
Quellencode in einem Quellencodefenster 23 auf dem BiWschrift der Anzeigeeinhcit 21 an. 

Bevor die ProgramraausfClhning bei dem oben beschriebenen System gcstartet wird, ist es crforderlich, den 
originalen Quellencode in ein ausf uhrbarcs Ptogramm zu Qbersetzen oder zu kompilieren. Bei der vorliegenden 
Erfindung sollte der Quellencode vor der Kompilierung modifiziert warden, und zwar ffir Oberwachimgs- und 
MeBzwecke, Spezifischer gesagt schiebt das ICompiliersystcm Subroutine-Ruf-Zustande in den Quellencode cin, 
ura einige Laufzeit-Subroutinen fur die Datensamrolung und Suraraierung an geeigneten Punkten in dem 

Programmaufzurufen. . . c* • n tw 

Der Quellencode eines parallel verarbeitenden Programms besitzt cine hierarchischc Struktur. Das Pro- 
gramm oder die Anwendcr-Anwendung besteht aus einer Vielzahl von Prozeduren. Ene Prozedur ruft einige 
andere Prozeduren auf; mit anderen Worten konnen Prozeduren verscbachtelt werden. Als Tatsadie ist der 
Hauptkorper des Programms cine Prozedur, <Ue implizit als "MAIN" bezeichnet wird, die mehrere Abkdrara- 
lingsprozeduren endialt Die Schleif e besteht aus einer Sequenz von Befehlen als Teil einer Prozedur. die itcrativ 
ausgefOhrt werden. 

Um die paralle Programmausfuhnmg zu unterstutzen, sieht das System eine Bibliothek von Routtnen vor, um 
eine ProzeBkommunikation. Synchronisation und andere Aufgaben auszufuhrcn, die bei der parallclen Verarbei- 
tung inharent vorkomracn. Diese werden als parallel vcrarbeitende Bibliotheksroutincn bezeichnet, welche 
durch die Prozeduren nach Bedarf aufgerufen werdea Da sie die Systemleistung als parallel laufende Zusatze 
beeinflussen, sind die parallel verarbeitenden Bibliotheksroutincn ein wichtiges Merkmal bei der AusfGhnmg der 
Profilbfldung. 

Fig. 2 zeigt ein FluBdiagramm, welches einen ProzeB der Modifizierung und Korapaierung eines Programms 
fur das Paralleb-echnersyst era 1 1 zeigt Dieser ProzeB enthalt die folgenden siebcn Schritte. 

[SI] Es wird der Quellencode eines parallel verarbeitenden Programms, welches in jedem Prozessor m dem 
Parailelrechnersystem 1 1 auszufiihren ist, ui das KompiGenmgssystem eingegeben. 

[S2] Es wird e'uie Feststellung zum Aufrufen emer Laufzeit-Subroutine # 1 in den Anfangsteil des Hauptpro- 
grammkorpers eingef ugt Die Laufzeit-Subroutine # 1 zeichnet die Zeit auf, wenn das Programm gestartet wmL 

[S3] Es werden Feststellungen zum Aufrufen der Laufzeit-Subroutinen #2 und 4^3 jeweOs in den Anfangsteil 
und in den Endteil jeder Prozedur eingef iigt, die in dem Quellencode enthalten ist 

[S4] Es werden Feststellungen zum Aufrufen der Laufzeit-Subroutinen 4^4 und 4»5 jeweils in den Anfangsteil 
und in den Endteil jeder Schleifc eingefugt, die in den Prozeduren enthalten ist . ^ * * ., 

[S5] Es werden Feststellungen zum Aufrufen der Laufzeit-Subroutinen # 6 und #7 jeweils m den Anfangsteil 
und in den Endteil jeder parallel verarbeitenden Bibliotheksroutine eingefCgt 

[S6] Es wird eine Feststellung zum Aufrufen der Laufzeit-Subroutine #8 in den Endteil des Hauptprogramra- 

korpers eingefugt , j. • j 

[S7] Das Kompilierungssystcm ubersetzt (oder korapiliert) die Quellencodedatei 15, die nun die bci den 
Schritten S2 bis S6 cingefOgten Subroutme-Aufruf-Feststellungen enthiit, in den Objektcode, der durch die 
Prozessoren 12a— 12nausfiihrbar ist , . 

Durch Ausfuhren der oben eriauterten Schritte SI bis S7 fOgt das Kompilierungs^tem emigc geeignete 
Feststellungen in die Quellencodedatei 15 cin, um die Laufzeit-Subroutinen fOr die Datensammlung und Aufsum- 
mierung aufzurufen und es kompiliert die Quellencodedatei 15, um den ausfuhrbaren Objektcode zu generierea 
Als ein Ergebnis enthalt der generierte Objektcode Subroutine-Aufruf-Befehle sowohl an den Start- als auch 
Endpunkten des Hauptprogrammkorpers, der Prozeduren, Schleifen und der parallel verarbeitenden Bibhot- 
heksroutinen. 

Fig. 3 faBi die Laufzeit-Subroutinen. die zum Zweck der LeistungsQberwachung und -analyse eingefunrt 
wurden. zusammea Die Tabelle 30 bcschreibt kurz die Funktionen der acht Laufzeit-Subroutinen in deren 
je weiligen Gelegenheiten, bei denen sie aufgerufen werden. 

Die in dieser Tabelle aufgelistetcn ersten sieben Subroutinen (* 1 bis #7) sind Subroutinen, die zum Sammein 
von Zeitwertzeichendaten und zum Akkumulieren der Ausfuhrungszeit von jedem Abschnitt des Parallelpro- 
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gramms ausgelegt sind Das heiBt, soldie Subroutinen # 1 — # 7 entsprcchcnd dcr Datensammeleinrichtung 
13a- 13n in Fig. 1. Die achte Subroutine #8 besteht aus einer Subroutine^ die zum Summieren der Daten 
ausgelegt ist die durch die Subroutinen # 1 bis # 7 gesammelt und akkumuliert wurdea Die Subroutine »3 
entspncht somit der Datensuramiereinrichtung 14a— 14n. 

Um auf die Fig. 4 bis 11 einzugehen. so das folgende hinsichtlich der detaiUierten Funktionen der Laufzeit- s 
Subroutinen # t - 4^ 8 erlautert, die in den Quellencode eingefUgt sind. 

Fig. 4 zeigt ein FluBdiagramni* welches die Laufzeit-Subroutine # 1 zeigt, die dann aufgerufen wird, wenn das 
Programra startct zu lauf en und die zwei folgenden Aufgaben vorsieht 

[S 1 1 a] InitiaJisieren eiaes ortiichen Datenbereiches, der zum Aufzeichnen und zum Analysieren des Prozessor- 
Verhaliens verwendet wird lo 

[Si 1 b] Aufzeichnen des Programmstartzeitpunktes. 

Die Fig. 5 und 6 sind FluBdiagramrae, welche die Laufzeit-Subroutinen #2 bzw. #3 zeigen. Die Laufzeit-Sub- 
routine #2 wird zu Beginn von jeder Prozedur aufgerufen und wie bei dem Schritt S12a von Fig. 5 gezeigt ist, 
zeichnet sie den AusfOhningsstartzeitpunkt dieser Prozedur auf. Als ein GegenstQck zu dieser Subroutine #2 
wird die Laufzeit-Subroutine #3 aufgerufen, wenn die Prozedur beendet wird und sie fuhrt die folgenden drei i$ 

Aufgaben aus: 

[S13a] ErhaJten der AusfQhrungs-Ende-Zeit der Prozedur. 

[S13b] Akkumulieren der Ausfuhrungszeit der Prozedur (das heiBt Akkumuiieren der Differenz zwischen der 
Ausfuhrungsstartzeit und der AusfOhrungs-Ende-Zeit)^ 

[S13c] Akkumulieren der AusfOhrungszeit von jeder parallel verarbeitenden BibUotheksroutine, die durch die 20 
Prozedur aufgerufen wurde (das heiBt Akkumulieren dcr Differenz zwischen der Ausfuhrungsstartzeit und der 
Ausfuhrung-Ende-Zeit, die durch die Laufzeit-Subroutinen #6 und #7 fur jede parallel verarbeitende BibUot- 
heksroutine aufgezeichnet wurde). 

Fig. 7 zeigt ein FluBdtagramm der Laubeit-Subroutine #4» welche aufgerufen wird wenn der Prozessor in 
einc Schleife eintritL Die Schleife umfaBt einc Folge von Befehlen, die iterativ ausgefuhrt werden, und zwar 25 
unter der Steuerung einer Schleifen-Zahler-Variablen. Jedesmal, wenn die Schleife ausgefOhrt wird wird die 
Schieifen-Zahler- Variable erbdht (oder verraindertX und zwar um ein vorbestimmtes Inkrement tmd es wird die 
Schleife wiederfaoit, bis die Schleifen-Zahler- Variable einen vorgeschriebenen Grenzwert erreicht oder andere 
Beendigungsbedingungen erf ullt sind Um statistische AusfOhningsdatea fflr die Schleifen zu samraein, fOhrt die 
Laufzeit-Subroutine #4 die folgenden zwei Aufgaben durch: 30 
[S Ma] Aufzeichnen der Ausfuhrungsstartzeit der Schleife. 

[S14b] Erhalten des Anfangswertes der Schleifen-Zahler-Variablen und des Inkrements (oder Schleifenzihier- 
SchrittgroBe) fiir jede Iteration, und Aufbewahren dcrselben fiir zukunfdge Verwendung. 

Fig. 8 zeigt ein FluBdiagramm der Laufzeit-Subroutine #5, die ausgefuhrt wird wenn eine Schleife beendet 
wird Diese fullt die folgenden vier Aufgaben fQr jede Schleife. 35 
[S15a] Erhalten der Ausfuhrung-Ende-Zeit der Schleife. 

[S15b] Akkumulieren der Ausfuhrungszeit der Schleife (das heiBt Akkumulieren der Differenz zwischen der 
Ausfuhrungsstartzeit und der Ausfuhrung-Ende-Zeit far die Schleife). 

[S15c] Erhalten des endgultigen Wertes der Schleifensteuer-Variablen und Berechnea der Zahl der Iterationen 
basierend auf den Anfangs- und Endwerten der Schleif en-Zihler-Variablen und der SchrittgroBe. 

[S15dl Akkumulieren der Zahl der Iterationen. 

[S15e] Akkumulieren der Ausfuhrungszeit von jeder parallel verarbeitenden BibUotheksroutine, die durch die 
Schleife aufgerufen wird Hier wird die Ausfuhnmgszeit dadurch erhalten, tndem die AusfOhrungsstartzeit bzw. 
Ausfuhrungsstartzeitpunkt von dem Ausiiilirung-Ende-Zeitpunkt subtrahiert wird die durch die Laufeeit-Sub- 
roudnen #6 und #7 fur jede parallel verarbeitende BibUotheksroutine aufgezeichnet wurden, die von der 
Schleife aufgerufen wurden. 

Die Fig. 9 und 10 zeigen die Laufzeit-Subroutinen #6 und #7, die aufgerufen werden, wenn ^ine paraUei 
verarbeitende BibUotheksroutine jewetis startet und endet Das heiBt, die Laufzeit-Subroutine #6 fOhrt den 
folgenden Schritt aus: 

[S16a] Aufzeichnen des AusfOhnmgsstartzeitpunktes der parallel verarbeitenden BibUotheksroutine. 50 

AJs GegenstOck zu dieser Laufzeit-Subroutine #6 erzeugt die Laufzeit-Subroutme # 7 folgendes: 
[SI 7a] Erhalten des Ausfuhrungs-Ende-Zeitpunktes der parallel verarbeitenden BibUotheksroutine. 
[Sl7b] Akkumulieren der Ausfuhrungszeit der parallel verarbeitenden BibUotheksroutine, wobei die Ausfuh- 
rungszeit die Differenz zwischen dem Ausfuhrungsstartzeitpunkt der bei dem Schrin S16a aufgezeichnet wurde, 
und dem Ausfuhrung-Ende-Zeitpunkt, der bei dem Schritt S 1 7 a erhalten wurde, ist 55 

Fig. 1 1 zeigt ein FluBdiagramm, welches die Laufzeit-Subroutine #8 wiedergibt die am Ende des gesamten 
Programms ausgefuhrt wird Die Laufzeit-Subroutine #8 summiert die Ausfuhnmgszeitdaten auf, die durch die 
anderen Laufzeit-Subroutinen # 1 bis # 7 gesammelt wurden, und zwar gemaB den folgenden Schritten: 
[SlSa] Berechnen der mittleren angesammelt Zeit von jeder parallel verarbeitenden BibUotheksroutine, die 
durch jede Prozedur aufgerufen wurde, gemaB den folgenden Gieichungen: 60 



40 



45 



Tcp(avg) - Tcp(m) 

n 

Twp(avg) .= ^2 Twp(ra) 



. . - (1) 
... (2) 
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n 

Top(avg) = Top(ra) ...(3) 

worin n eine ganze Zahl ist, welche die Anzahl der Prozcssorcn wiedergibt. die in dem Parallelrechnersystem 1 1 
involviert sind und m einc ganze Zahl ist* die von 1 bis n reicht und dazu vcrwendet wird, um einen spezifischen 
Prozessor anzuzeigen. Tcp(m) ist die akkumulierte Ausf Qhningszeit, welche der m'te Prozessor fur die Kommu* 
nikationsaufgaben verbraucht hat Tcp(avg) bedeutet einc mittlere angesammeke Ausfuhrungszeit, cfie fOr 
Kommunikationsaufgaben verbraucht wurde. Twp(in) ist die akkumulierte Ausfuhrungszeit, die der m'te Pro- 
zessor fur die Synchronisation verbraucht hat Twp(avg) bedeutet eine mittlere akkumulierte Ausfiihningszeit, 
die fur Synchronisationsaufgaben verbraucht wurde. Top(m) ist die akkumulierte AusfOhnmgszeit, die der m'te 
Prozessor fur Auf gaben verbraucht hat, die anders sind als die Kommunikations- und Synchronisationsaufgaben. 
Top(avg) bedeutet eine mittlere akkumulierte Ausfuhrungszeit, die fQr andere Aufgaben verbraucht wurde. 
[S18b] Berechnen des Maxtmaiwertes, Minimalwertes und der Standardabweichung o fur jede der akkumulier- 
ten AusfQhrungszeiten Tcp(m), Twp(m) und Top(m). 

[S18c] Berechnen der mittleren akkumutierten AusfOhrungszeit des Anwenderprogramms gemaB der folgenden 

Gleichung: 

n 

Tup(avg) = -j^^ Tup(m) 

H 

= (Tpp (m) -Tcp (m) -Twp (m) -Top (m) ) ... (4) 

worin Tpp(ra) die Ausfuhrungszeit bedeutet, die durch den m'ten Prozessor fur die in Betradit stehende 
Prozedur verbraucht wurde und wobei Tup(m)die Netto* AusfOhrungszeit des Anwenderprogramms bedeutet 

Tup(m)-Tpp(m)-Tcp{m)-Twp(m)-Top(m)) (5) 

[S18d] Berechnen des Maximalwertes» des Mimmalwertes und der Standardabweichung a fOr die akkumuKerte 
AusfOhrungszeit des Anwenderprogramms Tup(m). 

[S18e] Berechnen der mitderen angesammelten Zeit von jeder parallel verarbeitenden Bibliotheksroutine, die in 
jeder Schleif e auf geruf en wurde, gem^ den folgenden Gleichungen: 

n 

Tcl (avg) = Tel (m) ... (6) 

H 

Twl(avg) « Twl(m) -..{7) 

n 

Tol(avg) ^ Tol (m) ...(8) 

Tcl(m) ist die akkumulierte AusfOhnmgszeit, die der m'te Prozessor fur Kommunikationsaufgaben ben6tlgt hat 
Tcl(avg) bedeutet die mittlere angesammelte Ausfuhrungszeit, die fur Kommunikationsaufgaben verbraucht 
wurde. Twl(m) ist die akkumulierte Ausfuhrungszeit die der m'te Prozessor fur die Synchronisation bendtigt hat 
Twl(avg) bedeutet die mitdere akkumulierte Ausfuhrungszeit die fur Synchronisationsaufgaben verbraucht 
wurde. Tol(m) ist die akkumulierte Ausfuhrungszeit, die der m'te Prozessor fur Aufgaben verbraucht hat, anders 
als die Koromunikations- und Synchronisationsaufgaben. Tol(avg) bedeutet die mittlere akkumulierte Ausfuh- 
rungszeit, die fur andere Aufgaben verbraucht wurde. 

[S18f| Berechnen des Maximalwertes, des Mmimalwertes und der Standardabweichimg o fCr jede der akkumu- 
lierten AusfQhrungszeiten Tcl(m),Twl(ra) und Tol(m)L 

[S18g] Berechnen der mittleren angesammelten Ausfuhrungszeit des Anwenderprogramms gemafi der folgen- 
den Gleichung: 



TuKave) = Tul(^) 



worin Tpl(in) die AusfOhningszeit ist, die von dem m'ten Prozessor fur die in Betracht stehende Schleife 
verbraucht wurde und Tul(ni) die akkumulierte Netto- AusfOhrungszeit des AnwendeiprograxniDS ist 

Tul(ra)-TpI(ra)^Tcl(ra)-Twl(ni)-Tol(m)) (5) 

5 

[S18h] Berechnen des Maximalwertes, des Minimalwertes und der Standardabweichung o fflr die akkumulierte 
AusfOhrungszeit des Anwenderprogramras Tul(m). 

[S18i] Ausgeben der Ergebnissc der Schrittc S18a bis S18h als eine Profil-lnfonnationsdatei 16. 

Fig, 12 zeigt eine Tabelle, die die Informationen zusammenfafit, welche durch das Leistungsanaiysierersystem 
der vorliegenden Erfindung gesanunelt wurdea In dieser Tabelle 40 sind die gesammelteo InformationeD in lo 
EinMang mit dem Subjekt der Profllierungsoperationen klassifiziert welche Prozedurea Schleifen und parallel 
verarbeitende Bibliotheksroutinen enthalten, um die Komraunkation, Synchronisation und andere Aufgaben zu 
unterstutten. Obwohl in Fig. 12 nicht gezeigt, konnten bedingte Programmverzweigung auch in dem Profilsub- 
jekt enthalten sein. 

Ira allgemeinen werden Informationen, welche das Programmvcrhalten in jedem Prozessor betrcff ca an drei 15 
verschiedenen Stufen der Ausfuhning gesammelt: einer vorbereitenden Verarbeitungsstufe; einer Anlauf-Verar- 
beitungsstufe und einer Datenverarbeitungsstufe (terminal process stage). 

Die vorbereitende Verarbeitungsstuf e besteht aus einer Stufe, bevor eine bezeichnete Routine als Profilsub* 
jekt aufgerufen wir± Die drei Arten der Profil-Subjekte, die in der Tabelle 40 aufgelistet sind, erfordem es 
jedoch nicht daB Informationen an der vorbereitenden Verarbeitungsstufe gesammek werden. Wie oben 20 
dargelegt wurde, konnen auch bedingte Programraverzweigungen (in Rg. 7 nicht gezeigt) cin Ziel der Ausfuh- 
rungsprofiliening seia Wenn dies der Fall ist, werden zusatzliche Befehle in den Quellencode eingefuhrt, um eine . 
andere Laufzeit-Subroutine aufzurufen, um Informationen an aktueOen Verzwrigungsbediogungen zu sammela 
Speziell enthalten solche Vcrzweigungsbedingungen "Wahr- oder Falsch-'^dingungen als Ergebnis von logi- 
schen Operationen oder "negative, Ntill- oder positive" Bedingungen als em Ergebnis von arithmetischen 25 
Operationen, die vor den Verzweigungsbefehlen ausgefOhrt wurdea Die Laufzeit-Subroutine zahlt das Auftre- 
tcn von jeder solcher Bedingungen, bevor eine Verzweigung durchgefuhrt wirdl nSffllich bei der vorbereitenden 
Verarbeitungsstufe. 

Die Anlauf-Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine, die bei einem Profil-Subjekt 
beteiligt ist, zu laufen beginnt Spezieller gesagt, wird die Ausfulinmgsstartzeit an der Anlauf- Verarbeitungsstufe 30 
von jeder ProzeduT (siehe S12a in Fig. 5), Schleife (siehe S14a in Ftg« 7) oder parallel verarbeitendea BIbliotheks- 
routine (siehe S16a in Fig. 9) aufgezeichnet Ira Faile der Schleifen wird der Anfangswert einer Schleifenzahler* 
Variablen und etner Schleifenzahler-SchrittgroBe zusatzlich zu der Ausfuhrungsstartzeit (siehe S14b in Fig. 7) 
aufgezeichnet 

Die Datenverarbeitungsstufe oder Ende- Verarbeitungsstufe besteht aus einer Stufe, bei der eine Routine 35 
dabei ist zu endea Bei der Ende-Verarbeitungsstufe jeder Prozedur werden die Ausfuhnmgszeit der Prozedur 
und die AusfOhrungszeit von jeder parallel verarbeitenden Bibliotheksroutine, die innerhalb der Prozedur 
aufgerufen wurde. akkumuliert (siehe Sl3b und S13c in Fig. 6), wodurch die akkumulierten Ausfuhrungszeiten 
Tpp(raX Tcp(m), Twp(m) und Top(ra) erhaiten werdea In ahnlicher Weise werden bei der Ende-Verarbeitungs- 
stufe einer Schleife die Ausffihrungszeit der Schleife und die AusfOhrungszeit jeder parallel verarbeitenden 40 
Bibliotheksroutine, die innerhalb der Schleife aufgerufen wurde, akkumuliert (siehe S15b und St5e m Fig* Z\ 
wodurch die akkumulierten AusfOhnmgszeiten Tpi(m); Tcl(m), Twl(m) und To](m) fur die Schleife erhaiten 
werdea Zusatzlich wird bei der Ende-Verarbeitungsstufe von jeder Schleife die Zahl der Iterationen ebenso 
akkumuliert In bezug auf die parallel verarbeitenden Bibliotheksroutinen wird die Ausfuhnmgszeit von jeder 
Routine bei der Ende-Verarbeitungsstufe(sieheS17b in Fig. 10) akkumuliert 45 

Die bei den oben beschriebenen drei ProzeBstufen gesammelten Informationen werden am Ende des Pro- 
gramms summiert und werden dann als eine Profil-Informationsdatei 16 ausgegebea Ztun Wiederauffinden der 
summierten Informationen aus der ProfiMnformationsdatei 16 bietet der Profilanzeigeprozessor 17 Ausfuh- 
rungsprofiisummen dem Anwender dieses Systems aa Um den Anwender mit einer verstandUchen tmd informa- 
tiven Anzeige zu versehen, verwendet der Profilanzeigeprozessor 17 verschiedene DarsteUungsverfahren, die tm 50 
folgenden beschrieben werdea 

Fig. 13 zeigt ein Dtagramm, welches ein erstes Beispiel der aus Ausfiihnmgsprofilanzeige nach der vorliegen- 
den Erfindung veraxiscfaaulicht In diesem Fall bildet die Prozedur # 1 den Hauptkdrper des unter Test stehen- 
den parallel verarbeitenden Programms und es werden die Balkengraphiken fur die anderen Prozeduren und 
Schleifen hinsichtllch der AusfOhrungszeit der Prozedur # 1 skaiiert (das heiBt die Ausfuhnmgszeit des gesam- 55 
ten Progranuns). 

Die AusfuhrungsprofUanzeige, die In Fig. 13 veranschaulicht ist, enth^t Informationen hinsichtlich der Proze- 
duren # 1, «2 usw. und huisrchtiich der Schleifen « 1, #2 usw. Jede Balkengraphik ist In vierTeile eingeteilt: die 
Anwendcrprogramm-Ausfuhrungszeit Tu, die Kommunikationsaufgabe-Ausfuhrungszeit Tc, die Synchronisa- 
tionsaufgabe-Ausfuhrungszeit Tw und eine andere Aufgaben-Ausfuhrungszeit To. Die Aufteilung wird durch 60 
den Profilanzeigeprozessor 17 vorgenommen, und zwar im Einklang mit Mittelwerten der angesammelten 
Ausfuhrungszeitea 

Femer werden die Ergebnisse der statistischen Analyse fur Jede Ausfuhrungszeitkategorie auf den Balkengra- 
phiken uberlagert, wo die minimalen Werte mit einem Stemchenzeichen wiedergegeben sind, die maximalen 
Wcrte mit einem Symbol V wiedergegeben sind und die Standardabweichungen rait eInem horizontalen 65 
Liniensegmeni wiedergegeben sind, welches zwischen diesen gezeichnet ist 

Eine solche gerade Aus- Anzeige der AusfQhrungsstatistiken eriaubt es dem Anwender, in einfacher Weise die 
Beziehung zwischen dem Anwcnderprogramm und parallel verarbeitenden Zusatzea inklusive Kommunika- 



tions- und Syndironisationsaufgabcn zu unterscheiden. Daruber hinaus kann der Anwendcr durch das Vorsehen 
der Maximum-, Minimum- und Standardabweichungssymbole auf eincn BOck erkennen. in welcher Weise die 
Prozentsatze aktuell schwanken. Dieses Merkmal hilft dem Anwender sehr, das Verhalten der Prozeduren und 
Schlcifen zu verstehcn, die in eincra parallel vcrarbeitenden Programm enthalten sind, so daB diescr die 
5 Moglichkeit erhalt. zu beobachten. ob das Programm richtig arbeitet oder nicht und die Entschcidung trcffen 
Icann, ob weitere Programm-Modifikationen erfordcrlich sind oder nicht, um eine QualitStsverbcsserung zu 

erreichea . . . , ^ 

Fig. 14 zeigt cin Diagranun, welches cin zweites Beispiel der Ausf uhningspronlanzeige wiedergibt im Gcgen- 
satz zu dem ersten in Fig. 13 gezeigten Beispiel werden bei dem Verfahren nach dem zweiten Beispiel alle 
10 Prozeduren und SdUeifen in den individuelien ZeitmaBstaben sichibar gemacht, ungeachtet von deren absoluten 
Ausfuhrungszeitea Das heiBt, die Langen der Balkengraphikcn sind nicht proportional zu deren jeweiligen 
Ausfuhrungszeidangen. Die Graphiken in Fig. 14 erlauben es jedoch. daft der Anwender auf emfache Weise die 
Prozentsatze der Programrakomponenten verstehen kann (das heiBt Anwcnderprogramm Tu, Kommunika- 
tionsaufgabe To, Synchronisationsaufgabe Tw und andere Aufgabcn ToX die in jeder Prozedur oder Schleife 

15 involviertsind , . n 

Fig. 15 zeigt ein drittcs Beispiel einer AusfOhrungsprofdanzeige, bei der zwei Prozeduren # 1 und #2 m Form 
einer Kreisgraphik wiedergegeben sind Kreisgraphiken erlauben hn aligemeincn, daB der Anwender die Bezie- 
hung von Komponenten zu e'mer Gesamtheit einfacher vcrgleichen kann. Bei cUescm dritten Anzeigeverfahren 
zeigt ein gesamter Kieis von 360 Grad die gesamte akkumulierte AusfOhrungszeit einer Prozedur oder Schleife 

20 und vier Sektoren zeigen die Prozentsatze der Anwenderprogramm-Ausfuhrungszeit (Tu). der Kommunika- 
tionsaufgabe-Ausfuhrungszeii (Tc^ der Synchronisationsaufgabe-Ausfuhrungszeit (tw) und der anderen Aufga* 

be-Ausfuhrungszeit (To) an. ... 
Fig. 16 zeigt ein viertes Beispiel einer Ausfulinmgsprofilanzeige, bei der das AusfOhningsprofil m Form einer 

Radarkarte wiedergegeben ist Die Radarkartc in Fifr 16 besitzt vier Achsen entsprechcnd den vier Prograram- 
25 komponenten. Die akkumulierten Ausfuhrungszeitwertc (Tu, Tc, Tw und To) der Programmkomponentcn sind 

auf deren jeweiligen Achsen aufgetragcn und die aufgetragenen Punkte sind miteinander verbunden, um ein 

Polygon zu bildea Aus der Gestalt dieses Polygons kann der Anwender intuitiv die Eigensdiaften der Prozedur 

Oder Schleife verstehen, die in einer Radarkarte profiliert sind. 
Ahnlich den anderen Anzeigeverfahren, die sowcit beschricbcn wurden, umfaBt die Radarkarte, die in Fig. 16 
30 vcranschaulicht ist, Infonnationcn hinsichtlich der Minimal- und Maxiraalwerte und der Standardabweichung 

der akkumulierten AusfOhrungszeit. Dieses Merkmal ermdglicht es dem Anwendcr. das Verhalten jeder Pro- 

grammkomponente in einem detaiUierteren Wert zu verstehen. 
Fig* 17 zeigt cin funftes Beispiel einer Ausfuhrungsprofflanzeige geraaB der vorliegenden Erfindung. tin 

Ausfuhrungsprofilfenster 50 besteht aus vier Abschnitten 50a bis 50d Der erste Abschnitt 50a enthalt die 
35 Legendc der Balkengraphikcn, die in den anderen Abschnitten des Fcnsters 50 dargestellt sind. Spezieller gesagt. 

definiert die Legende die Farbklass'ifiziening fOr vier verschiedene Programmkomponenten. die bezeichnet s'md 

mit: 

Anwender: Anwenderprogramm. 
Com: Kommunikadonsaufgabe-Roudne. 
40 Sync: Synchronisattonsaufgabe-Routine. 
Runlib und Gop: andere Routinen. 
Das Ausfuhrungsprofilfenster 50 bei dem funften Beispiel verwendet diese Farbklassifizierung zusammen nut 

dem Darstcllungsverf ahren wic in Fig. 13. 
Der zweite Abschnitt 50b des Ausfuhrungsprofilfensters 50 zeigt ein prozedur-gestutztcs Ausfuhrungsprofil. 
45 welches die akkumulierten AusfQhrungszeiten von mehreren Prozeduren, wic beispielsweise "MAIN*, "calcr, 
''calc2". "cputim" und InitaL", aufsummiert * 

Der dritte Abschnitt 50c des Ausfflhrungsprofilfensters 50 zeigt ein fang-gestOtztes (caller-based) AusfQh- 
ningsprofU, welches die akkumulierte Ausflftrungszeit von jeder Prozedur zusammen mit dem Namen von 
dcssen Fang-Routine (caller routme)zusammenfaBt Beispielsweise liest sich die oberste Zxtxlt dieses Abscfanitts 
50 wiefolgt: 

calcl < 1032s > MAIN <UNSPECinED 

worin das links bezeichnete "calcl" der Name der Prozedur ist. die durch cine Fang-Routine ''MAIN* gerufen 
55 wurde. Das am weitesten rechts gelegene Zeichen" < UNSPECIFIED* bedeutet, daB die Fang-Routine nicht 
ihren eigenen Programmnamen deklariert und der inharente Name "MAIN" durch das Analysierersystem 
verwendet wird. Die Zciic zeigt auch an. daB die akkumulierte AusfOhrungszeit dieser Prozedur "calcr gleich 
10^2 Sekunden betragt 

Die Balkengraphik fur diese "calcr-Prozedur ist farb-klassifiziert gemafi der Legende. die in dem ersten 
60 Abschnitt 50a definiert ist, wobei vier Telle der Balkengraphik jeweils die akkumulierten AusfQhrungszeiten Tu, 
Tc. Tw und To zeigt, und zwar zusammen mit der Anzeige des Minimums, Maximums und der Standardabwei- 
chung. 

Der vierte Abschnitt 50d des AusfQhrungsprofilfensters 50 zeigt ein nifer-gestutztes AusfuhrungsprotiL 
Bebpielsweise liest sich die oberste Zeile des Abschnitts 50d wie folgt: 
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MAIN < UNSPECIFIED inital 

worin die Angabe "MAIN < UNSPECIFIED" den Namen einer Rufer-Routine zeigt und die andere Aufschrift 
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^nital'' den Naraen einer genifenen Prozedur anzeigt Die Balkengraphik fiSr diese Initar-Prozedur ist farb-klas- 
sifiziert gemaO der in deni erslen Abschnitt 50a dcfinierten Legcnde. Sie besteht aus vier Teilen, die jeweiis die 
akkumulierten Ausfuhrungszeiten Tu, Tc, Tw und To ais auch deren Minimum- und Maximumwerte und 
Standardabweichung mit den zuvor erwahnten Symbolen zeigeit 

Fig. 18 zeigte ein sechstes Beispiel der Ausfuhrungsprofildarstellung gemaB der vorliegenden Erfindung. En $ 
Ausfuhningsprofilfenster 60 besteht aus vier Absdinitten 60a bb 60d Der erste Abschnitt 60a Hefert die 
Legende von Balkengraphiken, die in den anderen Abschnitten des Fensters 60 dargestellt werden und spezieller 
deff niert ist die Farbklassifilcation fOr vier Programmkomponenten, die bezeichnet sind mit: 
Anwender: Anwenderprogramm. 

Com : Kommunikationsauf gabe-Routine. to 
Sync: Synchronisadonsaufgabe-Routine. 
Runlib und Gop: andere Routinen. 

Die Legende umfaBt auch die Farbklassifizierung f&r Verzweigungsbedmgungen, die enthalt 'HVahr^- und 
Talsch'-Bedingungen fOr logische Operationen und "negative*, "T^uU-* und "positive* Bedingungen for arithmeti- 
scheOperadonen. 15 

Der zweite Abschnitt 60b des Ausfuhrungsprofilfensters 60 zeigt ein Ausfuhrungsprofil, welches die akkumu- 
lienen AusfQhrungszeiten fur mehrere Schleifen zusammenfaBt 

Der dritte Abschrutt 60c des Ausfuhrungspronifensters 50 zeigt ein Ausfiihrungsprofil welches cfie Verzwei- 
gungsbedingungen zusammenfaBt Die obere Balkengraphik in dem dritten Abschiiitt 60c veranschauiicht die 
Prozentsatze von 'Wahr*- Bedingungen und "Falsch'-Bedingungen, die tatsachlich als ein Ergebnis der logisdien 20 
Operationen aufgetreten sind Die hinterc Balkengraphik veranschauiicht die Prozentsatze von "positiven*, 
'TvJuU-" und ''negativen" Bedingungen, die tatsachlich als ein Ergebnis der arithmctischen Operadonen aufgetre- . 
ten sind 

Der vierte Abschnitt 16d des Ausfuhrungsprofilfensters 60 liefert ein genifenen-gestQtztes (caller-based) 
AusfuhrungsprofiL welches das gleiche ist wie bei dem dritten Abschnitt 50c in 17. 25 

Zusammenfassend fur die Fig* 12 bis 17 gibt die voriiegende Ausfiihnmgsform die Ergebnisse der Leistungs- 
analyse wieder, und zwar unter Verwendung einer Vielfalt von Darstellungsverf ahren. Neben der Mdglichkeit, 
die raitderc Ausfiihrungszcit von jeder Subjekt-Roudne dantcUen zu konnen, zeigt das vorUegendc Analysicrer- 
system die Maximum^ Minimum- und Standardabweichung der Ausfuhrungszeiten, wodurch der Anwender die 
Mdglichkeit erhdlt, mit einem Blick zu erkennen, wie die E^ozentsatze tatsachlich schwanken. 30 

Bei der vorliegenden AusfQhrungsform analysiert das Leistungsanalysierersystem das Parailelrechnersystem 
1 1 (siehe Fig. 1), welches aus vielfachen Prozessoren # I bis #n besteht Jedoch kann die voriiegende Erfindung 
auch auf ein einzeines Prozessorsystem angewandt werden, welches vielfache Aufgaben ausfuhrt, und zwar 
durch Verwendung eines Zeitteilungsverfahrens. In diesem Fall sammeln mehrere geeignete Laufzeit*Subrouti- 
nen Ausfuhrungsdaten fiir einzehie Prozesse oder Module, welche virtuell parallel laufen und das Leistungsana* 35 
lysierersystem summiert die gesamraelten Daten auf und stellt die Ergebnisse als AusfOhrungsproHle dar. Wie 
bei der vorliegenden Ausfuhrungsform zeigt das AusfuhrungsprofiL welches auf einem Bildschirm dargestellt 
wird mtttlere. Minimum- und Maximum-Ausfuhrungszeiten und die Standardabweichung von dem Mittelwert 
hinsichtlich der Subjektprozesse oder Module. 

Die vorangegangene Beschreibung dient lediglich der Veraxischaulichung der Prinzipien der vorliegenden 40 
Erfindung. Da femer vietfaldge Modifikadonen und Anderungen fur den Fachmann offensichtlich sind ist nicht 
beabsichdgt die Erfindung auf die exakte Konstrukdon und Anwendungen zu beschrankea die beschrieben 
wurden, und demzufolge Fallen aile geeigneten ModifScationen jmd ilquivalenten AusfOfarungen in den Rahmen 
der Erfindung geraaB den anh3ngenden AnsprQchen und deren Aquivalente. 



Patentanspruche 



45 



1. Verfahren zur sichtbaren Darstellung von Ergebnisscn einer LeistungsOberwachung und -analyse fur ein 
Parailelrechnersystem, bei dem eine Vielzahl von Prozessoren ein parallel verarbeltendes Programm aus- 
fuhren, welches aus einer Vielzahl von Routinen zusammengesetzt ist wobei das Verfahren die folgenden so 
Schritte umfaBt: 

(a) Sammeln von Informationen hinsichtlich der Ausfuhrungszeit von jeder Routine* die gleichlaufend 
durch eine Vielzahl von Prozessoren ausgefuhrt wird unter Berucksichtigung der Klassifizierung der 
Routinen; 

(b) Ableiten eines Maximalwertes, eines Mittelwertes, eines Miniraaiwertes und einer Standardabwet- 55 
Chung der Ausfuhrungszeit von jeder Routine basierend auf den Informationen, die fur die Vlebudil der 
Prozessoren gesammelt wurden; und 

(c) graphisches Darstellen der Ausfuhrungsprofil-Informarion, welche den Maximalwert den Mittel- 
wert und den Mmimalwert und die Standardabweichung der Ausfuhnmgszeit jeder Routine enthalt 

2. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die Ausfuhrungszeit von jeder Routine akkumu- 150 
lien wird jedesmal wenn die Routine aufgerufen und ausgefiihrt wird 

3. Verfahren nach Anspruch 1, bei dem bei dem Schritt (a) die AusfQhrungszeit von jeder Routine gesam- 
melt wird die als ein Subjekt der Profilierung bezeichnet wurde. 

4. Verfahren nach Anspruch 1. bei dem bei dem Schritt. (a) die Routinen in ein Anwenderprogramm, 
Kommunikationsaufgaben, Synchronisationsaufgaben und andere Aufgaben klassifiziert werden. 65 

5. Verfahren nach Anspruch 3, bei dem das Subjekt der Profilierung Prozeduren, Schleifen und parallel 
verarbeitende Bibliotheksroutinen enthalt 

6. Verfahren nach Anspruch 1 , bei dem bei dem Schritt (b) femer die Standardabweichung der AusfUhrungs* 



zeit von jcdcr Routine zusatzlich zu dcm Maximalwert, dem Mitteiwert und dem Minimaiweit berechnet 
wird« 

7. Verfahren nach Anspruch 1, bei dero bei dem Schritt (c) Rufcr-Routincn und/oder Genifener-Routinen 
aus den Routinen in dem parallel verarbciteodcn Programm cxtrahiert werden und die AusfQhrungsprofil- 

information, welche zu den extrahierten Routinen gehdrt,dargestellt winL 

8. Verfahren nach Anspruch I. bei dem bei dem Schritt (c) cine Balkengraphik verwendet wird^um graphisch 
die Ausfuhningsprofilinformation von jeder Routine darzustetlea 

9. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Kreisgraphik verwendet winL um graphisch 
die Ausfuhrungsprofilinforniation von jeder Routine darzusteUea 

10. Verfahren nach Anspruch 1, bei dem bei dem Schritt (c) eine Radarkarte verwendet wird, um die 
Ausfiihrungsprofilinformation von jeder Routine graphisch darzustellen. 

11. Verfahrennach Anspruch 1, welches femerdiefolgcndenSchrittcumfaBt: 

(d) Annehmen ciner Bezeichnung cines Punktes der Ausfuhrungsprofilinforniation, die bei dem Schritt 
(c) dargestellt wird, und 

(e) Darstellen eines Teiles des Quellencodes des parallel verarbeitenden Programms, welches dem 
bezeichneten Punkt der AusfuhrungsprofiUnf ormation entspricht 

11 Etn computer-lesbares Mediunv wek;hes mit einem Cdmputer-Programm oodiert ist, bei dem das 
Verfahren nach Anspruch 1 implementiert ist 

Hierzu 18Seite(n)Zeichnungen 
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